我们展示了通过大规模多代理端到端增强学习的大射击可转移到真正的四轮压力机的无人驾驶群体控制器的可能性。我们培训由神经网络参数化的政策,该政策能够以完全分散的方式控制群体中的各个无人机。我们的政策,在具有现实的四轮流物理学的模拟环境中训练,展示了先进的植绒行为,在紧张的地层中执行侵略性的操作,同时避免彼此的碰撞,破裂和重新建立地层,以避免与移动障碍的碰撞,并有效地协调追求障碍,并有效地协调追求逃避任务。在模拟中,我们分析了培训制度的不同模型架构和参数影响神经群的最终表现。我们展示了在模拟中学习的模型的成功部署到高度资源受限的物理四体体执行站保持和目标交换行为。在Propers网站上提供代码和视频演示,在https://sites.google.com/view/swarm-rl上获得。
translated by 谷歌翻译
We present a novel dataset named as HPointLoc, specially designed for exploring capabilities of visual place recognition in indoor environment and loop detection in simultaneous localization and mapping. The loop detection sub-task is especially relevant when a robot with an on-board RGB-D camera can drive past the same place (``Point") at different angles. The dataset is based on the popular Habitat simulator, in which it is possible to generate photorealistic indoor scenes using both own sensor data and open datasets, such as Matterport3D. To study the main stages of solving the place recognition problem on the HPointLoc dataset, we proposed a new modular approach named as PNTR. It first performs an image retrieval with the Patch-NetVLAD method, then extracts keypoints and matches them using R2D2, LoFTR or SuperPoint with SuperGlue, and finally performs a camera pose optimization step with TEASER++. Such a solution to the place recognition problem has not been previously studied in existing publications. The PNTR approach has shown the best quality metrics on the HPointLoc dataset and has a high potential for real use in localization systems for unmanned vehicles. The proposed dataset and framework are publicly available: https://github.com/metra4ok/HPointLoc.
translated by 谷歌翻译
The paper discusses the improvement of the accuracy of an inertial navigation system created on the basis of MEMS sensors using machine learning (ML) methods. As input data for the classifier, we used infor-mation obtained from a developed laboratory setup with MEMS sensors on a sealed platform with the ability to adjust its tilt angles. To assess the effectiveness of the models, test curves were constructed with different values of the parameters of these models for each core in the case of a linear, polynomial radial basis function. The inverse regularization parameter was used as a parameter. The proposed algorithm based on MO has demonstrated its ability to correctly classify in the presence of noise typical for MEMS sensors, where good classification results were obtained when choosing the optimal values of hyperpa-rameters.
translated by 谷歌翻译
矩阵的特征分类是基于基质分解的概率模型中的中心过程,例如主成分分析和主题模型。基于有限样本估计的这种分解的不确定性对于使用此类模型时的不确定性是必不可少的。本文解决了计算固定尺寸协方差矩阵特征向量各个条目的置信界的挑战。此外,我们得出了一种方法来绑定逆协方差矩阵的条目,即所谓的精度矩阵。我们方法背后的假设是最小的,要求存在协方差矩阵,其经验估计量会收敛到真正的协方差。我们利用U统计理论来绑定经验协方差矩阵的$ L_2 $扰动。从此结果,我们使用Weyl定理和特征值 - 元素向量身份获得了特征向量的边界,并使用矩阵扰动界限在精度矩阵的条目上得出置信区间。作为这些结果的应用,我们演示了一项新的统计测试,该测试使我们能够测试精度矩阵的非零值。我们将该测试与众所周知的Fisher-Z检验进行了比较,并证明了所提出的统计测试的健全性和可扩展性,及其在医学和物理领域的现实世界数据中的应用。
translated by 谷歌翻译
现代ASR体系结构的优化是最高的优先任务之一,因为它为模型培训和推理节省了许多计算资源。该工作提出了一种基于标准构象模型的新的UCONV-CONFORM-FORM-FORMENTERTURE结构,该模型将输入序列长度始终减少16次,从而加快了中间层的工作。为了解决时间维度的大幅减少解决收敛问题,我们使用与U-NET体系结构相似的UP抽样块,以确保正确的CTC损耗计算并稳定网络训练。UCONV-CONFORMENTER架构在训练和推理方面似乎不仅更快,而且与基线构象异构体相比,它的表现更好。我们最佳的UCONV-CONFORNER模型分别在CPU和GPU上显示了40.3%的时期训练时间缩短,47.8%和23.5%的推理加速度。librispeech test_clean和test_other上的相对WER降低了7.3%和9.2%。
translated by 谷歌翻译
在这项工作中,我们将神经头部的头像技术推向百万像素分辨率,同时着重于跨驾驶合成的特别挑战性的任务,即,当驾驶图像的外观与动画源图像大不相同时。我们提出了一组新的神经体系结构和训练方法,这些方法可以利用中分辨率的视频数据和高分辨率图像数据,以达到所需的渲染图像质量和对新视图和运动的概括。我们证明,建议的架构和方法产生令人信服的高分辨率神经化身,在跨驾驶场景中表现优于竞争对手。最后,我们展示了如何将受过训练的高分辨率神经化身模型蒸馏成一个轻量级的学生模型,该模型是实时运行的,并将神经化身的身份锁定到数十个预定的源图像。实时操作和身份锁对于许多实际应用头像系统至关重要。
translated by 谷歌翻译
本文表明,基于对称决策树的梯度提升可以等效地重新重新重新构成核法,该方法会收敛到某个内核无脊回归问题的解决方案。因此,对于低级内核,我们获得了与高斯过程的收敛后均值,这又使我们能够轻松地将梯度从后部转化为采样器,从而通过蒙特卡洛估计来提供更好的知识不确定性估计。后方差。我们表明,提出的采样器允许更好的知识不确定性估计值,从而改善了域外检测。
translated by 谷歌翻译
钢筋学习的最新进展证明了其在超级人类水平上解决硬质孕代环境互动任务的能力。然而,由于大多数RL最先进的算法的样本低效率,即,需要大量培训集,因此在实际和现实世界任务中的应用目前有限。例如,在Dota 2中击败人类参与者的Openai五种算法已经训练了数千年的游戏时间。存在解决样本低效问题的几种方法,可以通过更好地探索环境来提供更有效的使用或旨在获得更相关和多样化的经验。然而,为了我们的知识,没有用于基于模型的算法的这种方法,其在求解具有高维状态空间的硬控制任务方面的高采样效率。这项工作连接了探索技术和基于模型的加强学习。我们设计了一种新颖的探索方法,考虑了基于模型的方法的特征。我们还通过实验证明我们的方法显着提高了基于模型的算法梦想家的性能。
translated by 谷歌翻译
预测其序列的抗体的结构是重要的,因为它允许在卫生行业中发挥至关重要作用的合成抗体的更好设计方法。抗体的大多数结构是保守的。最可变和难以预测的部分是{\ IT第三互补确定区域的抗体重链}(CDR H3)。最近,已经采用了深度学习来解决CDR H3预测的任务。然而,目前的最先进的方法不是端到端,而是它们输出残留的距离和方向,以与基于统计和物理的方法一起使用这种附加信息来预测3D结构。这不允许快速筛选过程,因此抑制靶向合成抗体的发育。在这项工作中,我们介绍了一个端到端模型来预测CDR H3环路结构,其在准确性方面与最先进的方法执行,但数量级更快。我们还提出了一个常用的RosettaAntibody基准测试,该基准导致数据泄漏,即列车和测试数据集中的相同序列的存在。
translated by 谷歌翻译
隐私和沟通效率是联邦神经网络培训中的重要挑战,并将它们组合仍然是一个公开的问题。在这项工作中,我们开发了一种统一高度压缩通信和差异隐私(DP)的方法。我们引入基于相对熵编码(REC)到联合设置的压缩技术。通过对REC进行微小的修改,我们获得了一种可怕的私立学习算法,DP-REC,并展示了如何计算其隐私保证。我们的实验表明,DP-REC大大降低了通信成本,同时提供与最先进的隐私保证。
translated by 谷歌翻译